首页> 外文OA文献 >A novel word segmentation method based on object detection and deep learning
【2h】

A novel word segmentation method based on object detection and deep learning

机译:基于目标检测和深度学习的新型分词方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The segmentation of individual words is a crucial step in several data mining methods for historical handwritten documents. Examples of applications include visual searching for query words (word spotting) and character-by-character text recognition. In this paper, we present a novel method for word segmentation that is adapted from recent advances in computer vision, deep learning and generic object detection. Our method has unique capabilities and it has found practical use in our current research project. It can easily be trained for different kinds of historical documents, uses full gray scale information, does not require binarization as pre-processing or prior segmentation of individual text lines. We evaluate its performance using established error metrics, previously used in competitions for word segmentation, and demonstrate its usefulness for a 15th century handwritten document.
机译:在历史手写文档的几种数据挖掘方法中,单个单词的分割是至关重要的一步。应用程序的示例包括对查询词的视觉搜索(词点识别)和逐个字符的文本识别。在本文中,我们提出了一种新的分词方法,该方法与计算机视觉,深度学习和通用对象检测的最新进展相适应。我们的方法具有独特的功能,并且已在我们当前的研究项目中得到实际应用。可以轻松地针对不同种类的历史文档进行培训,使用完整的灰度级信息,不需要二进制化作为单个文本行的预处理或在先分割。我们使用已建立的错误度量标准(先前曾在分词比赛中使用)评估其性能,并展示其在15世纪手写文档中的有用性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号